AMD představila MI300 pro El Capitan: 24× Zen 4 + CDNA 3 + Infinity Cache + HBM3
Po Instinct MI25, MI50 / 60, MI100 a MI200 přichází logicky Instinct MI300. Přesto, že název nenaznačuje žádnou změnu konceptu a působí dojmem prosté další generace, přichází tato řada s několika změnami, které ji řadí do jiné kategorie než všechny předchůdce.
S MI300 přestává být řada Instinct pouhým výpočetním / GPGPU akcelerátorem a stává se kompletním řešením, které v jednom pouzdru integruje procesor, akcelerátor i systémovou paměť. V podstatě jde tedy o více než APU / SoC, MI300 lze označit jako SiP (System in Package).
MI300A, jak se varianta pro superpočítač El Capitan nazývá, sestává z hlavních (CPU / GPU) čipletů vyráběných na 5nm procesu TSMC. Procesorové integrují 24 jader Zen 4, grafické pak akcelerátory s architekturou CDNA 3.
Protože by jejich výkonu nestačilo ani osmi čipů HBM3 s datovou propustností přes 6,5 TB/s a běžná cache integrovaná v čipletu (MI250X disponovala 16MB L2 cache), integruje 6nm podložka nesoucí čiplety jak 4. generaci sběrnice Infinity Fabric ke vzájemnému propojení čipletů a pouzder, tak velkokapacitní Infinity Cache.
Konkrétní hodnotu AMD zatím neuvedla (lze předpokládat, že si něco chce nechat na srpnovou akci HotChips), ale je myslím bezpečné tvrdit, že oproti 16MB cache u MI250X půjde o přinejmenším řádový posun.
Celé pouzdro obsahuje křemík složený ze 146 miliard tranzistorů, tedy téměř dvojnásobek toho co Nvidia Hopper H100 a téměř o polovinu více než Intel Ponte Vecchio / Xe-HPC / Max Series 1550 GPU. Řešení je postavené na unifikované paměťové architektuře, takže 128 GB integrované HBM3 je plně sdílených pro procesorová i GPGPU jádra (nedochází k duplikaci dat nebo kopírování mezi systémovou pamětí a pamětí akcelerátoru). AMD očekává, že výkon MI300 oproti MI250X v AI akceleraci stoupne až 8× a energetická efektivita až 5×.
Pokud jde o energetickou efektivitu, superpočítač El Capitan měl původně projektovanou spotřebu kolem 40 MW, ale zadavetel nakonec předpokládá, že při plné reálné zátěži bude dosahovat spotřeby jen kolem 30 MW.
AMD očekává, že posun výkonu i efektivity MI300 umožní společnosti překonat vytyčený cíl nazvaný 30×25. Jde o označení závazku z roku 2019, kdy si společnost stanovila třicetinásobný nárůst energetické efektivity v HPC systémech do roku 2025.
National Nuclear Security Administration (NNSA), která bude El Capitan provozovat, hodlá paralelně s ním využívat i svůj starší superpočítač Sierra. Z toho důvodu byly rozšířeny možnosti napájení celého výpočetního parku z 45 na 85 MW a chladící systém byl rozšířen z kapacity 10 tisíc tun vody na 28 tisíc tun. Napájení celého chladícího systému je pak dimenzováno na 15 MW.